Fusion de multi-modalités et réduction par sémantique latente
نویسندگان
چکیده
This paper studies Latent Semantic Analysis (LSA) between visual and textual elements of a multimedia collection, applied on two different tasks: (1) multimedia document retrieval (MDR) and (2) automatic image annotation (AIA). Latent semantics, usually used for text indexing, is applied to discover hidden semantic relations between visual and textual descriptors. The contributions of this paper are twofold. First, to the best of our knowledge, this work is the first study of the influence of LSA on the retrieval of a significant number of multimedia documents (i.e. collection of 20000 tourist images). Second, it shows how different image representations (region-based and keypoint-based) can be combined by LSA to improve automatic image annotation. The document collections used for these experiments are the Corel photo collection and ImageCLEF 2006 collection. MOTS-CLÉS : Recherche d’information, annotation automatique, sémantique latente, modèle de fusion
منابع مشابه
Modeling Semantic Memory
Computational models of semantics infer semantic structure from the analysis of large linguistic corpora. Two approaches are described here. In each case the data consist of a document-by-word matrix, counting the number of times a word was used in a document. Latent Semantic Analysis uses dimension reduction to construct a high-dimensional semantic space from such a matrix. Information in sema...
متن کاملExploration d'une collection de chansons à partir d'une interface de visualisation basée sur une analyse des paroles
Résumé. Dans cet article, nous présentons une approche de fouille de textes ainsi qu’une interface de visualisation afin d’explorer une large collection de chansons frana̧ises à partir des paroles. Dans un premier temps, nous collectons paroles et métadonnées de différentes sources sur le Web. Nous utilisons une approche combinant clustering et analyse sémantique latente afin d’identifier différ...
متن کاملVers un résumé automatique de séries télévisées basé sur une recherche multimodale d'histoires
RÉSUMÉ. Les séries télévisées récentes multiplient les personnages principaux, développant ainsi des intrigues complexes présentées à travers plusieurs histoires entremêlées. Nous proposons une approche de détection automatique de ces histoires afin de générer un résumé vidéo par extraction de scènes représentatives de ces dernières, et nous présentons un outil de visualisation rapide des histo...
متن کاملAnalyse Texte et Image pour la caractérisation de l'activité dans les Films d'Animation
RÉSUMÉ. Définir une indexation pertinente sur le contenu sémantique des films ou vidéos est un défi actuel. Nous proposons de rechercher et de caractériser l’activité contenue dans un film à partir d’une analyse conjointe texte et image. L’analyse des images nous donne de nombreux indicateurs, pauvres en sémantique, tandis que l’étude des textes courts que sont les synopsis nous donne des indic...
متن کاملKnowledge evaluation based on LSA: MCQs and free answer questions
In this paper, we present an application using the SUMMA-LSA platform developed by Baier, Lehnard, Hoffmann & Schneider (this volume). SUMMA-LSA was used to evaluate biology knowledge of 7th and 8th grades students dealing with !The human body energy requirements ". Student knowledge has been measured by means of classical and “evidential” multiple choices questions (MCQs) as well as open quest...
متن کامل